/********

Project - College affirmative action bans and health risk behaviors

Dataset - National Youth Risk Behavior Survey (YRBS)

Version - May 29, 2019 (for replication archive)

Description - This file contains the code we used to create the majority of our cleaned YRBS dataset (YRBS_datafile.dta). 
As we constructed this code to build a larger dataset to be used for other projects, there will be code for variables not used in
this analysis. These variables are NOT included in YRBS_datafile.dta (as these were not examined as outcomes or covariates
and to make the file size smaller). Nevertheless, we keep the code in place for users who may want to work with the YRBS 
for other purposes.

The code below calls a source data file for the National YRBS for each wave between 1991-2015. More recently, the CDC has put
forth a datafile that includes all National YRBS waves. Both the individual years and the merged data file can be found here:
https://www.cdc.gov/healthyyouth/data/yrbs/data.htm. We provide the stata files for the individual years with this extract.

The last part of the code cleans the data and merges in state-year level information from other sources. We do not include these
files separately as all of the information is available in the main data file.

********/

*FILE PATHS
*Set source and destination

global data "[YOUR FILEPATH]"

***********************************
****PART A - CLEAN INDIVIDUAL YEARS
***********************************

**YEAR = 1991
use "$data/yrbs1991.dta", clear
destring, replace

**Drop unneeded variables
drop Q5 Q7 Q8 Q9 Q10 Q11 Q12 Q13 Q15 Q17 Q18 Q24 Q25 Q27 Q29 Q30 Q31 Q32 Q33  
drop Q36 Q39 Q41 Q42 Q44 Q45 Q46 Q47 Q49 Q50 Q52 Q54 Q55 Q56 Q58 Q59 Q60 Q61 Q62
drop Q63 Q64 Q65 Q66 Q67 Q68 Q69 Q70 Q71 Q72 Q73 Q74 Q75  

**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==1
replace race=2 if Q4==2
replace race=3 if Q4==3
replace race=4 if Q4==4
replace race=4 if Q4==5
replace race=4 if Q4==6
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==1
replace race_min=2 if Q4==2
replace race_min=2 if Q4==3
replace race_min=3 if Q4==4
replace race_min=3 if Q4==5
replace race_min=3 if Q4==6
tab race_min Q4, missing
rename Q4 race6
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q6==5
replace seatbelt=2 if Q6==1
replace seatbelt=2 if Q6==2
replace seatbelt=2 if Q6==3
replace seatbelt=2 if Q6==4
tab seatbelt Q6, missing
drop Q6
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q28==2
replace smoke_n_cat=1 if Q28==3
replace smoke_n_cat=1 if Q28==4
replace smoke_n_cat=1 if Q28==5
replace smoke_n_cat=1 if Q28==6
replace smoke_n_cat=1 if Q28==7
replace smoke_n_cat=2 if Q28==1
tab smoke_n_cat Q28, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q34==2
replace alc_n_cat=1 if Q34==3
replace alc_n_cat=1 if Q34==4
replace alc_n_cat=1 if Q34==5
replace alc_n_cat=1 if Q34==6
replace alc_n_cat=1 if Q34==7
replace alc_n_cat=2 if Q34==1
tab alc_n_cat Q34, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q37==2
replace mar_cat=1 if Q37==3
replace mar_cat=1 if Q37==4
replace mar_cat=1 if Q37==5
replace mar_cat=1 if Q37==6
replace mar_cat=1 if Q37==7
replace mar_cat=2 if Q37==1
tab mar_cat Q37, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q38==2
replace mar_cat_month=1 if Q38==3
replace mar_cat_month=1 if Q38==4
replace mar_cat_month=1 if Q38==5
replace mar_cat_month=1 if Q38==6
replace mar_cat_month=2 if Q38==1
tab mar_cat_month Q38, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q40==2
replace cocaine_cat=1 if Q40==3
replace cocaine_cat=1 if Q40==4
replace cocaine_cat=1 if Q40==5
replace cocaine_cat=1 if Q40==6
replace cocaine_cat=2 if Q40==1
tab cocaine_cat Q40, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q43==2
replace drugs_cat=1 if Q43==3
replace drugs_cat=1 if Q43==4
replace drugs_cat=1 if Q43==5
replace drugs_cat=1 if Q43==6
replace drugs_cat=2 if Q43==1 
tab drugs_cat Q43, missing
drop Q43 
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q51==2
replace sex_n_cat=1 if Q51==3
replace sex_n_cat=1 if Q51==4
replace sex_n_cat=1 if Q51==5
replace sex_n_cat=1 if Q51==6
replace sex_n_cat=1 if Q51==7
replace sex_n_cat=1 if Q51==8
replace sex_n_cat=2 if Q51==1
tab sex_n_cat Q51, missing
*Condom use
gen condom=.
replace condom=1 if Q53==2
replace condom=2 if Q53==1
replace condom=2 if Q53==3
tab condom Q53, missing
drop Q53
*year
gen year=1991
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q14 weapon
rename Q16 fight
rename Q19 suicide_attempt
rename Q20 suicide_plan
rename Q21 suicide_n
rename Q22 suicide_injury
rename Q23 smoke_ever
rename Q28 smoke_n_cont
rename Q26 smoke_reg
rename Q34 alc_n_cont
rename Q35 alc_binge
rename Q37 mar_cont
rename Q38 mar_cont_month
rename Q40 cocaine_cont
rename Q48 sex_ever
rename Q51 sex_n_cont
rename Q57 self_weight

save "$data/yrbs1991_edit2.dta", replace

*&&YEAR = 1993:
use "$data/yrbs1993.dta" , clear
destring, replace
**Drop unneeded variables
drop Q5 Q7 Q8 Q9 Q10 Q11 Q12 Q14 Q15 Q16 Q17 Q18 Q20 Q21 Q22 Q23 Q29 Q31 Q33 Q34 
drop Q35 Q36 Q37 Q38 Q39 Q42 Q43 Q46 Q47 Q49 Q50 Q52 Q53 Q54 Q55 Q56 Q58 Q59 Q61
drop Q63 Q64 Q65 Q67 Q68 Q69 Q70 Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81
drop Q82 Q83 Q84 Q85 Q86 Q87 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==1
replace race=2 if Q4==2
replace race=3 if Q4==3
replace race=4 if Q4==4
replace race=4 if Q4==5
replace race=4 if Q4==6
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==1
replace race_min=2 if Q4==2
replace race_min=2 if Q4==3
replace race_min=3 if Q4==4
replace race_min=3 if Q4==5
replace race_min=3 if Q4==6
tab race_min Q4, missing
rename Q4 race6
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q6==5
replace seatbelt=2 if Q6==1
replace seatbelt=2 if Q6==2
replace seatbelt=2 if Q6==3
replace seatbelt=2 if Q6==4
tab seatbelt Q6, missing
drop Q6
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q32==2
replace smoke_n_cat=1 if Q32==3
replace smoke_n_cat=1 if Q32==4
replace smoke_n_cat=1 if Q32==5
replace smoke_n_cat=1 if Q32==6
replace smoke_n_cat=1 if Q32==7
replace smoke_n_cat=2 if Q32==1
tab smoke_n_cat Q32, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q40==2
replace alc_n_cat=1 if Q40==3
replace alc_n_cat=1 if Q40==4
replace alc_n_cat=1 if Q40==5
replace alc_n_cat=1 if Q40==6
replace alc_n_cat=1 if Q40==7
replace alc_n_cat=2 if Q40==1
tab alc_n_cat Q40, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q44==2
replace mar_cat=1 if Q44==3
replace mar_cat=1 if Q44==4
replace mar_cat=1 if Q44==5
replace mar_cat=1 if Q44==6
replace mar_cat=1 if Q44==7
replace mar_cat=2 if Q44==1
tab mar_cat Q44, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q45==2
replace mar_cat_month=1 if Q45==3
replace mar_cat_month=1 if Q45==4
replace mar_cat_month=1 if Q45==5
replace mar_cat_month=1 if Q45==6
replace mar_cat_month=2 if Q45==1
tab mar_cat_month Q45, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q48==2
replace cocaine_cat=1 if Q48==3
replace cocaine_cat=1 if Q48==4
replace cocaine_cat=1 if Q48==5
replace cocaine_cat=1 if Q48==6
replace cocaine_cat=2 if Q48==1
tab cocaine_cat Q48, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q51==2
replace drugs_cat=1 if Q51==3
replace drugs_cat=1 if Q51==4
replace drugs_cat=1 if Q51==5
replace drugs_cat=1 if Q51==6
replace drugs_cat=2 if Q51==1 
tab drugs_cat Q51, missing
drop Q51
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q60==2
replace sex_n_cat=1 if Q60==3
replace sex_n_cat=1 if Q60==4
replace sex_n_cat=1 if Q60==5
replace sex_n_cat=1 if Q60==6
replace sex_n_cat=1 if Q60==7
replace sex_n_cat=1 if Q60==8
replace sex_n_cat=2 if Q60==1
tab sex_n_cat Q60, missing
*Condom use
gen condom=.
replace condom=1 if Q62==2
replace condom=2 if Q62==1
replace condom=2 if Q62==3
tab condom Q62, missing
drop Q62
*year
gen year=1993
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q13 weapon
rename Q19 fight
rename Q24 suicide_attempt
rename Q25 suicide_plan
rename Q26 suicide_n
rename Q27 suicide_injury
rename Q28 smoke_ever
rename Q32 smoke_n_cont
rename Q30 smoke_reg
rename Q40 alc_n_cont
rename Q41 alc_binge
rename Q44 mar_cont
rename Q45 mar_cont_month
rename Q48 cocaine_cont
rename Q57 sex_ever
rename Q60 sex_n_cont
rename Q66 self_weight

save "$data/yrbs1993_edit2.dta", replace

**YEAR = 1995

use "$data/yrbs1995.dta" , clear
destring, replace
**Drop unneeded variables
drop Q6 Q7 Q8 Q9 Q10 Q11 Q13 Q14 Q15 Q16 Q17 Q19 Q20 Q21 Q27 Q29 Q30 Q31 Q32 Q33  
drop Q34 Q35 Q36 Q37 Q40 Q41 Q44 Q45 Q47 Q48 Q50 Q52 Q53 Q54 Q55 Q57 Q58 Q60 Q62 
drop Q63 Q65 Q66 Q67 Q68 Q69 Q70 Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81 Q82 
drop Q83 Q84 Q86 Q88 Q87 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==1
replace race=2 if Q4==2
replace race=3 if Q4==3
replace race=4 if Q4==4
replace race=4 if Q4==5
replace race=4 if Q4==6
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==1
replace race_min=2 if Q4==2
replace race_min=2 if Q4==3
replace race_min=3 if Q4==4
replace race_min=3 if Q4==5
replace race_min=3 if Q4==6
tab race_min Q4, missing
rename Q4 race6
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q5==5
replace seatbelt=2 if Q5==1
replace seatbelt=2 if Q5==2
replace seatbelt=2 if Q5==3
replace seatbelt=2 if Q5==4
tab seatbelt Q5, missing
drop Q5
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q28==2
replace smoke_n_cat=1 if Q28==3
replace smoke_n_cat=1 if Q28==4
replace smoke_n_cat=1 if Q28==5
replace smoke_n_cat=1 if Q28==6
replace smoke_n_cat=1 if Q28==7
replace smoke_n_cat=2 if Q28==1
tab smoke_n_cat Q28, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q38==2
replace alc_n_cat=1 if Q38==3
replace alc_n_cat=1 if Q38==4
replace alc_n_cat=1 if Q38==5
replace alc_n_cat=1 if Q38==6
replace alc_n_cat=1 if Q38==7
replace alc_n_cat=2 if Q38==1
tab alc_n_cat Q38, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q42==2
replace mar_cat=1 if Q42==3
replace mar_cat=1 if Q42==4
replace mar_cat=1 if Q42==5
replace mar_cat=1 if Q42==6
replace mar_cat=1 if Q42==7
replace mar_cat=2 if Q42==1
tab mar_cat Q42, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q43==2
replace mar_cat_month=1 if Q43==3
replace mar_cat_month=1 if Q43==4
replace mar_cat_month=1 if Q43==5
replace mar_cat_month=1 if Q43==6
replace mar_cat_month=2 if Q43==1
tab mar_cat_month Q43, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q46==2
replace cocaine_cat=1 if Q46==3
replace cocaine_cat=1 if Q46==4
replace cocaine_cat=1 if Q46==5
replace cocaine_cat=1 if Q46==6
replace cocaine_cat=2 if Q46==1
tab cocaine_cat Q46, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q49==2
replace high_cat=1 if Q49==3
replace high_cat=1 if Q49==4
replace high_cat=1 if Q49==5
replace high_cat=1 if Q49==6
replace high_cat=2 if Q49==1
tab high_cat Q49, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q51==2
replace drugs_cat=1 if Q51==3
replace drugs_cat=1 if Q51==4
replace drugs_cat=1 if Q51==5
replace drugs_cat=1 if Q51==6
replace drugs_cat=2 if Q51==1 
tab drugs_cat Q51, missing
drop Q51 
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q59==2
replace sex_n_cat=1 if Q59==3
replace sex_n_cat=1 if Q59==4
replace sex_n_cat=1 if Q59==5
replace sex_n_cat=1 if Q59==6
replace sex_n_cat=1 if Q59==7
replace sex_n_cat=1 if Q59==8
replace sex_n_cat=2 if Q59==1
tab sex_n_cat Q59, missing
*Condom use
gen condom=.
replace condom=1 if Q61==2
replace condom=2 if Q61==1
replace condom=2 if Q61==3
tab condom Q61, missing
drop Q61
*year
gen year=1995
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q12 weapon
rename Q18 fight
rename Q22 suicide_attempt
rename Q23 suicide_plan
rename Q24 suicide_n
rename Q25 suicide_injury
rename Q26 smoke_ever
rename Q28 smoke_n_cont
rename Q85 smoke_reg
rename Q38 alc_n_cont
rename Q39 alc_binge
rename Q42 mar_cont
rename Q43 mar_cont_month
rename Q46 cocaine_cont
rename Q49 high_cont
rename Q56 sex_ever
rename Q59 sex_n_cont
rename Q64 self_weight

save "$data/yrbs1995_edit2.dta", replace

**YEAR = 1997

use "$data/yrbs1997.dta" , clear
destring, replace
**Drop unneeded variables
drop Q6 Q7 Q8 Q9 Q10 Q11 Q13 Q14 Q15 Q16 Q17 Q19 Q20 Q21 Q27 Q29 Q30 Q31 Q32 Q33  
drop Q34 Q35 Q36 Q37 Q40 Q41 Q44 Q45 Q47 Q48 Q50 Q52 Q53 Q54 Q55 Q57 Q58 Q60 Q62 
drop Q63 Q65 Q66 Q67 Q68 Q69 Q70 Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81 Q82 
drop Q83 Q84 Q86 Q88 Q87 Q89  
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==1
replace race=2 if Q4==2
replace race=3 if Q4==3
replace race=4 if Q4==4
replace race=4 if Q4==5
replace race=4 if Q4==6
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==1
replace race_min=2 if Q4==2
replace race_min=2 if Q4==3
replace race_min=3 if Q4==4
replace race_min=3 if Q4==5
replace race_min=3 if Q4==6
tab race_min Q4, missing
rename Q4 race6
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q5==5
replace seatbelt=2 if Q5==1
replace seatbelt=2 if Q5==2
replace seatbelt=2 if Q5==3
replace seatbelt=2 if Q5==4
tab seatbelt Q5, missing
drop Q5
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q28==2
replace smoke_n_cat=1 if Q28==3
replace smoke_n_cat=1 if Q28==4
replace smoke_n_cat=1 if Q28==5
replace smoke_n_cat=1 if Q28==6
replace smoke_n_cat=1 if Q28==7
replace smoke_n_cat=2 if Q28==1
tab smoke_n_cat Q28, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q38==2
replace alc_n_cat=1 if Q38==3
replace alc_n_cat=1 if Q38==4
replace alc_n_cat=1 if Q38==5
replace alc_n_cat=1 if Q38==6
replace alc_n_cat=1 if Q38==7
replace alc_n_cat=2 if Q38==1
tab alc_n_cat Q38, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q42==2
replace mar_cat=1 if Q42==3
replace mar_cat=1 if Q42==4
replace mar_cat=1 if Q42==5
replace mar_cat=1 if Q42==6
replace mar_cat=1 if Q42==7
replace mar_cat=2 if Q42==1
tab mar_cat Q42, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q43==2
replace mar_cat_month=1 if Q43==3
replace mar_cat_month=1 if Q43==4
replace mar_cat_month=1 if Q43==5
replace mar_cat_month=1 if Q43==6
replace mar_cat_month=2 if Q43==1
tab mar_cat_month Q43, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q46==2
replace cocaine_cat=1 if Q46==3
replace cocaine_cat=1 if Q46==4
replace cocaine_cat=1 if Q46==5
replace cocaine_cat=1 if Q46==6
replace cocaine_cat=2 if Q46==1
tab cocaine_cat Q46, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q49==2
replace high_cat=1 if Q49==3
replace high_cat=1 if Q49==4
replace high_cat=1 if Q49==5
replace high_cat=1 if Q49==6
replace high_cat=2 if Q49==1
tab high_cat Q49, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q51==2
replace drugs_cat=1 if Q51==3
replace drugs_cat=1 if Q51==4
replace drugs_cat=1 if Q51==5
replace drugs_cat=1 if Q51==6
replace drugs_cat=2 if Q51==1 
tab drugs_cat Q51, missing
drop Q51 
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q59==2
replace sex_n_cat=1 if Q59==3
replace sex_n_cat=1 if Q59==4
replace sex_n_cat=1 if Q59==5
replace sex_n_cat=1 if Q59==6
replace sex_n_cat=1 if Q59==7
replace sex_n_cat=1 if Q59==8
replace sex_n_cat=2 if Q59==1
tab sex_n_cat Q59, missing
*Condom use
gen condom=.
replace condom=1 if Q61==2
replace condom=2 if Q61==1
replace condom=2 if Q61==3
tab condom Q61, missing
drop Q61
*year
gen year=1997
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q12 weapon
rename Q18 fight
rename Q22 suicide_attempt
rename Q23 suicide_plan
rename Q24 suicide_n
rename Q25 suicide_injury
rename Q26 smoke_ever
rename Q28 smoke_n_cont
rename Q85 smoke_reg
rename Q38 alc_n_cont
rename Q39 alc_binge
rename Q42 mar_cont
rename Q43 mar_cont_month
rename Q46 cocaine_cont
rename Q49 high_cont
rename Q56 sex_ever
rename Q59 sex_n_cont
rename Q64 self_weight

save "$data/yrbs1997_edit2.dta", replace

**YEAR = 1999

use "$data/yrbs1999.dta" , clear
destring, replace
**Drop unneeded variables
drop Q7 Q8 Q10 Q11 Q13 Q14 Q15 Q16 Q18 Q19 Q28 Q30 Q31 Q32 Q33 Q35 Q36 Q37 Q38 Q39 
drop Q40 Q43 Q45 Q47 Q49 Q51 Q54 Q55 Q56 Q58 Q59 Q61 Q63 Q64 Q66 Q67 Q68 Q69 Q70 
drop Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81 Q82 Q84 Q85 Q86 Q88 Q87 Q89 
drop Q90 Q91 Q92 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==6
replace race=2 if Q4==3
replace race=3 if Q4==4
replace race=3 if Q4==7
replace race=4 if Q4==1
replace race=4 if Q4==2
replace race=4 if Q4==5
replace race=4 if Q4==8
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==6
replace race_min=2 if Q4==3
replace race_min=2 if Q4==4
replace race_min=2 if Q4==7
replace race_min=3 if Q4==1
replace race_min=3 if Q4==2
replace race_min=3 if Q4==5
replace race_min=3 if Q4==8
tab race_min Q4, missing
gen race6=.
replace race6=1 if Q4==6
replace race6=2 if Q4==3
replace race6=3 if Q4==4
replace race6=3 if Q4==7
replace race6=4 if Q4==2
replace race6=4 if Q4==5
replace race6=5 if Q4==1
replace race6=6 if Q4==8
tab race6 Q4, missing
drop Q4
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q9==5
replace seatbelt=2 if Q9==1
replace seatbelt=2 if Q9==2
replace seatbelt=2 if Q9==3
replace seatbelt=2 if Q9==4
tab seatbelt Q9, missing
drop Q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q29==2
replace smoke_n_cat=1 if Q29==3
replace smoke_n_cat=1 if Q29==4
replace smoke_n_cat=1 if Q29==5
replace smoke_n_cat=1 if Q29==6
replace smoke_n_cat=1 if Q29==7
replace smoke_n_cat=2 if Q29==1
tab smoke_n_cat Q29, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q41==2
replace alc_n_cat=1 if Q41==3
replace alc_n_cat=1 if Q41==4
replace alc_n_cat=1 if Q41==5
replace alc_n_cat=1 if Q41==6
replace alc_n_cat=1 if Q41==7
replace alc_n_cat=2 if Q41==1
tab alc_n_cat Q41, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q44==2
replace mar_cat=1 if Q44==3
replace mar_cat=1 if Q44==4
replace mar_cat=1 if Q44==5
replace mar_cat=1 if Q44==6
replace mar_cat=1 if Q44==7
replace mar_cat=2 if Q44==1
tab mar_cat Q44, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q46==2
replace mar_cat_month=1 if Q46==3
replace mar_cat_month=1 if Q46==4
replace mar_cat_month=1 if Q46==5
replace mar_cat_month=1 if Q46==6
replace mar_cat_month=2 if Q46==1
tab mar_cat_month Q46, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q48==2
replace cocaine_cat=1 if Q48==3
replace cocaine_cat=1 if Q48==4
replace cocaine_cat=1 if Q48==5
replace cocaine_cat=1 if Q48==6
replace cocaine_cat=2 if Q48==1
tab cocaine_cat Q48, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q50==2
replace high_cat=1 if Q50==3
replace high_cat=1 if Q50==4
replace high_cat=1 if Q50==5
replace high_cat=1 if Q50==6
replace high_cat=2 if Q50==1
tab high_cat Q50, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q52==2
replace drugs_cat=1 if Q52==3
replace drugs_cat=1 if Q52==4
replace drugs_cat=1 if Q52==5
replace drugs_cat=1 if Q52==6
replace drugs_cat=1 if Q53==2
replace drugs_cat=1 if Q53==3
replace drugs_cat=1 if Q53==4
replace drugs_cat=1 if Q53==5
replace drugs_cat=1 if Q53==6
replace drugs_cat=2 if Q52==1 & Q53==1 
tab drugs_cat Q52, missing
tab drugs_cat Q53, missing
drop Q52 Q53 
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q60==2
replace sex_n_cat=1 if Q60==3
replace sex_n_cat=1 if Q60==4
replace sex_n_cat=1 if Q60==5
replace sex_n_cat=1 if Q60==6
replace sex_n_cat=1 if Q60==7
replace sex_n_cat=1 if Q60==8
replace sex_n_cat=2 if Q60==1
tab sex_n_cat Q60, missing
*Condom use
gen condom=.
replace condom=1 if Q62==2
replace condom=2 if Q62==1
replace condom=2 if Q62==3
tab condom Q62, missing
drop Q62
*year
gen year=1999
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q5 hght
rename Q6 wght
rename Q12 weapon
rename Q17 fight
rename Q20 hurt_date
rename Q21 forced
rename Q22 depressed
rename Q23 suicide_attempt
rename Q24 suicide_plan
rename Q25 suicide_n
rename Q26 suicide_injury
rename Q27 smoke_ever
rename Q29 smoke_n_cont
rename Q34 smoke_reg
rename Q41 alc_n_cont
rename Q42 alc_binge
rename Q44 mar_cont
rename Q46 mar_cont_month
rename Q48 cocaine_cont
rename Q50 high_cont
rename Q57 sex_ever
rename Q60 sex_n_cont
rename Q65 self_weight
rename Q83 tv

save "$data/yrbs1999_edit2.dta", replace


**YEAR = 2001:

use "$data/yrbs2001.dta", clear
destring, replace
**Drop unneeded variables
drop Q7 Q8 Q9 Q11 Q12 Q14 Q15 Q16 Q17 Q19 Q20 Q29 Q31 Q32 Q33 Q34 Q36 Q37 Q38 Q39 
drop Q40 Q41 Q44 Q46 Q48 Q50 Q52 Q55 Q56 Q57 Q59 Q60 Q62 Q64 Q65 Q67 Q68 Q69 Q70 
drop Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81 Q82 Q84 Q85 Q86 Q88 Q87 Q89 
drop Q92 Q93 Q94 Q95 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==6
replace race=2 if Q4==3
replace race=3 if Q4==4
replace race=3 if Q4==7
replace race=4 if Q4==1
replace race=4 if Q4==2
replace race=4 if Q4==5
replace race=4 if Q4==8
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==6
replace race_min=2 if Q4==3
replace race_min=2 if Q4==4
replace race_min=2 if Q4==7
replace race_min=3 if Q4==1
replace race_min=3 if Q4==2
replace race_min=3 if Q4==5
replace race_min=3 if Q4==8
tab race_min Q4, missing
gen race6=.
replace race6=1 if Q4==6
replace race6=2 if Q4==3
replace race6=3 if Q4==4
replace race6=3 if Q4==7
replace race6=4 if Q4==2
replace race6=4 if Q4==5
replace race6=5 if Q4==1
replace race6=6 if Q4==8
tab race6 Q4, missing
drop Q4
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q10==5
replace seatbelt=2 if Q10==1
replace seatbelt=2 if Q10==2
replace seatbelt=2 if Q10==3
replace seatbelt=2 if Q10==4
tab seatbelt Q10, missing
drop Q10
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q30==2
replace smoke_n_cat=1 if Q30==3
replace smoke_n_cat=1 if Q30==4
replace smoke_n_cat=1 if Q30==5
replace smoke_n_cat=1 if Q30==6
replace smoke_n_cat=1 if Q30==7
replace smoke_n_cat=2 if Q30==1
tab smoke_n_cat Q30, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q42==2
replace alc_n_cat=1 if Q42==3
replace alc_n_cat=1 if Q42==4
replace alc_n_cat=1 if Q42==5
replace alc_n_cat=1 if Q42==6
replace alc_n_cat=1 if Q42==7
replace alc_n_cat=2 if Q42==1
tab alc_n_cat Q42, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q45==2
replace mar_cat=1 if Q45==3
replace mar_cat=1 if Q45==4
replace mar_cat=1 if Q45==5
replace mar_cat=1 if Q45==6
replace mar_cat=1 if Q45==7
replace mar_cat=2 if Q45==1
tab mar_cat Q45, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q47==2
replace mar_cat_month=1 if Q47==3
replace mar_cat_month=1 if Q47==4
replace mar_cat_month=1 if Q47==5
replace mar_cat_month=1 if Q47==6
replace mar_cat_month=2 if Q47==1
tab mar_cat_month Q47, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q49==2
replace cocaine_cat=1 if Q49==3
replace cocaine_cat=1 if Q49==4
replace cocaine_cat=1 if Q49==5
replace cocaine_cat=1 if Q49==6
replace cocaine_cat=2 if Q49==1
tab cocaine_cat Q49, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q51==2
replace high_cat=1 if Q51==3
replace high_cat=1 if Q51==4
replace high_cat=1 if Q51==5
replace high_cat=1 if Q51==6
replace high_cat=2 if Q51==1
tab high_cat Q51, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q90==2
replace drugs_cat=1 if Q90==3
replace drugs_cat=1 if Q90==4
replace drugs_cat=1 if Q90==5
replace drugs_cat=1 if Q90==6
replace drugs_cat=1 if Q53==2
replace drugs_cat=1 if Q53==3
replace drugs_cat=1 if Q53==4
replace drugs_cat=1 if Q53==5
replace drugs_cat=1 if Q53==6
replace drugs_cat=1 if Q54==2
replace drugs_cat=1 if Q54==3
replace drugs_cat=1 if Q54==4
replace drugs_cat=1 if Q54==5
replace drugs_cat=1 if Q54==6
replace drugs_cat=1 if Q91==2
replace drugs_cat=1 if Q91==3
replace drugs_cat=1 if Q91==4
replace drugs_cat=1 if Q91==5
replace drugs_cat=1 if Q91==6
replace drugs_cat=2 if Q90==1 & Q53==1 & Q54==1 & Q91==1
tab drugs_cat Q90, missing
tab drugs_cat Q53, missing
tab drugs_cat Q54, missing
tab drugs_cat Q91, missing
drop Q90 Q53 Q54 Q91
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q61==2
replace sex_n_cat=1 if Q61==3
replace sex_n_cat=1 if Q61==4
replace sex_n_cat=1 if Q61==5
replace sex_n_cat=1 if Q61==6
replace sex_n_cat=1 if Q61==7
replace sex_n_cat=1 if Q61==8
replace sex_n_cat=2 if Q61==1
tab sex_n_cat Q61, missing
*Condom use
gen condom=.
replace condom=1 if Q63==2
replace condom=2 if Q63==1
replace condom=2 if Q63==3
tab condom Q63, missing
drop Q63
*year
gen year=2001
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q5 hght
rename Q6 wght
rename Q13 weapon
rename Q18 fight
rename Q21 hurt_date
rename Q22 forced
rename Q23 depressed
rename Q24 suicide_attempt
rename Q25 suicide_plan
rename Q26 suicide_n
rename Q27 suicide_injury
rename Q28 smoke_ever
rename Q30 smoke_n_cont
rename Q35 smoke_reg
rename Q42 alc_n_cont
rename Q43 alc_binge
rename Q45 mar_cont
rename Q47 mar_cont_month
rename Q49 cocaine_cont
rename Q51 high_cont
rename Q58 sex_ever
rename Q61 sex_n_cont
rename Q66 self_weight
rename Q83 tv

save "$data/yrbs2001_edit2.dta", replace


**YEAR = 2003

use "$data/yrbs2003.dta" , clear
destring, replace
**Drop unneeded variables
drop Q7 Q8 Q10 Q11 Q13 Q14 Q15 Q16 Q17 Q19 Q20 Q29 Q31 Q32 Q33 Q35 Q36 Q37 Q38 Q39 
drop Q40 Q43 Q45 Q47 Q49 Q51 Q55 Q56 Q57 Q59 Q60 Q62 Q64 Q65 Q67 Q68 Q69 Q70 
drop Q71 Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q81 Q82 Q84 Q85 Q86 Q88 Q87 Q89 Q90
drop QN7 QN8 QN9 QN10 QN11 QN12 QN13 QN14 QN15 QN16 QN17 QN18
drop QN19 QN20 QN21 QN22 QN23 QN24 QN25 QN26 QN27 QN28 QN29 QN30 QN31 QN32 QN33
drop QN34 QN35 QN36 QN37 QN38 QN39 QN40 QN41 QN42 QN43 QN44 QN45 QN46 QN47 QN48
drop QN49 QN50 QN51 QN52 QN53 QN54 QN55 QN56 QN57 QN58 QN59 QN60 QN61 QN62 QN63
drop QN64 QN65 QN66 QN67 QN68 QN69 QN70 QN71 QN72 QN73 QN74 QN75 QN76 QN77 QN78
drop QN79 QN80 QN81 QN82 QN83 QN84 QN85 QN86 QN87 QN88 QN89 QN90 QN91 QN92 
drop qnfrcig qnanytob qnfrvg qndlype qnminpa qnnopa  qnrovwgt qnovwgt
drop qnstore qnabstsx qnrespsx qntencig 
drop Q92 Q93 Q94 Q95 Q96 Q97 QN93 QN94 QN95 QN96 QN97 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if Q4==6
replace race=2 if Q4==3
replace race=3 if Q4==4
replace race=3 if Q4==7
replace race=4 if Q4==1
replace race=4 if Q4==2
replace race=4 if Q4==5
replace race=4 if Q4==8
tab race Q4, missing
gen race_min=.
replace race_min=1 if Q4==6
replace race_min=2 if Q4==3
replace race_min=2 if Q4==4
replace race_min=2 if Q4==7
replace race_min=3 if Q4==1
replace race_min=3 if Q4==2
replace race_min=3 if Q4==5
replace race_min=3 if Q4==8
tab race_min Q4, missing
 gen race6=.
replace race6=1 if Q4==6
replace race6=2 if Q4==3
replace race6=3 if Q4==4
replace race6=3 if Q4==7
replace race6=4 if Q4==2
replace race6=4 if Q4==5
replace race6=5 if Q4==1
replace race6=6 if Q4==8
tab race6 Q4, missing
drop Q4
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q9==5
replace seatbelt=2 if Q9==1
replace seatbelt=2 if Q9==2
replace seatbelt=2 if Q9==3
replace seatbelt=2 if Q9==4
tab seatbelt Q9, missing
drop Q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q30==2
replace smoke_n_cat=1 if Q30==3
replace smoke_n_cat=1 if Q30==4
replace smoke_n_cat=1 if Q30==5
replace smoke_n_cat=1 if Q30==6
replace smoke_n_cat=1 if Q30==7
replace smoke_n_cat=2 if Q30==1
tab smoke_n_cat Q30, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q41==2
replace alc_n_cat=1 if Q41==3
replace alc_n_cat=1 if Q41==4
replace alc_n_cat=1 if Q41==5
replace alc_n_cat=1 if Q41==6
replace alc_n_cat=1 if Q41==7
replace alc_n_cat=2 if Q41==1
tab alc_n_cat Q41, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q44==2
replace mar_cat=1 if Q44==3
replace mar_cat=1 if Q44==4
replace mar_cat=1 if Q44==5
replace mar_cat=1 if Q44==6
replace mar_cat=1 if Q44==7
replace mar_cat=2 if Q44==1
tab mar_cat Q44, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q46==2
replace mar_cat_month=1 if Q46==3
replace mar_cat_month=1 if Q46==4
replace mar_cat_month=1 if Q46==5
replace mar_cat_month=1 if Q46==6
replace mar_cat_month=2 if Q46==1
tab mar_cat_month Q46, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q48==2
replace cocaine_cat=1 if Q48==3
replace cocaine_cat=1 if Q48==4
replace cocaine_cat=1 if Q48==5
replace cocaine_cat=1 if Q48==6
replace cocaine_cat=2 if Q48==1
tab cocaine_cat Q48, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q50==2
replace high_cat=1 if Q50==3
replace high_cat=1 if Q50==4
replace high_cat=1 if Q50==5
replace high_cat=1 if Q50==6
replace high_cat=2 if Q50==1
tab high_cat Q50, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q52==2
replace drugs_cat=1 if Q52==3
replace drugs_cat=1 if Q52==4
replace drugs_cat=1 if Q52==5
replace drugs_cat=1 if Q52==6
replace drugs_cat=1 if Q53==2
replace drugs_cat=1 if Q53==3
replace drugs_cat=1 if Q53==4
replace drugs_cat=1 if Q53==5
replace drugs_cat=1 if Q53==6
replace drugs_cat=1 if Q54==2
replace drugs_cat=1 if Q54==3
replace drugs_cat=1 if Q54==4
replace drugs_cat=1 if Q54==5
replace drugs_cat=1 if Q54==6
replace drugs_cat=1 if Q91==2
replace drugs_cat=1 if Q91==3
replace drugs_cat=1 if Q91==4
replace drugs_cat=1 if Q91==5
replace drugs_cat=1 if Q91==6
replace drugs_cat=2 if Q52==1 & Q53==1 & Q54==1 & Q91==1
tab drugs_cat Q52, missing
tab drugs_cat Q53, missing
tab drugs_cat Q54, missing
tab drugs_cat Q91, missing
drop Q52 Q53 Q54 Q91
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q61==2
replace sex_n_cat=1 if Q61==3
replace sex_n_cat=1 if Q61==4
replace sex_n_cat=1 if Q61==5
replace sex_n_cat=1 if Q61==6
replace sex_n_cat=1 if Q61==7
replace sex_n_cat=1 if Q61==8
replace sex_n_cat=2 if Q61==1
tab sex_n_cat Q61, missing
*Condom use
gen condom=.
replace condom=1 if Q63==2
replace condom=2 if Q63==1
replace condom=2 if Q63==3
tab condom Q63, missing
drop Q63
*year
gen year=2003
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q5 hght
rename Q6 wght
rename Q12 weapon
rename Q18 fight
rename Q21 hurt_date
rename Q22 forced
rename Q23 depressed
rename Q24 suicide_attempt
rename Q25 suicide_plan
rename Q26 suicide_n
rename Q27 suicide_injury
rename Q28 smoke_ever
rename Q30 smoke_n_cont
rename Q34 smoke_reg
rename Q41 alc_n_cont
rename Q42 alc_binge
rename Q44 mar_cont
rename Q46 mar_cont_month
rename Q48 cocaine_cont
rename Q50 high_cont
rename Q58 sex_ever
rename Q61 sex_n_cont
rename Q66 self_weight
rename Q83 tv
rename Weight weight
rename Stratum stratum

save "$data/yrbs2003_edit2.dta", replace


**YEAR = 2005

use "$data/yrbs2005.dta" , clear
destring, replace
**Drop unneeded variables
drop q7 q8 q10 q11 q13 q14 q15 q16 q17 q19 q20 q29 q31 q32 q33 q35 q36 q37 q38 q39 
drop q40 q43 q45 q47 q49 q54 q55 q56 q58 q59 q61 q63 q65 q66 q67 q68 q69 q70 
drop q71 q72 q73 q74 q75 q76 q77 q78 q79 q80 q82 q83 q84 q85 q86 q88 q87 q89 q91
drop qn7 qn8 qn9 qn10 qn11 qn12 qn13 qn14 qn15 qn16 qn17 qn18
drop qn19 qn20 qn21 qn22 qn23 qn24 qn25 qn26 qn27 qn28 qn29 qn30 qn31 qn32 qn33
drop qn34 qn35 qn36 qn37 qn38 qn39 qn40 qn41 qn42 qn43 qn44 qn45 qn46 qn47 qn48
drop qn49 qn50 qn51 qn52 qn53 qn54 qn55 qn56 qn57 qn58 qn59 qn60 qn61 qn62 qn63
drop qn64 qn65 qn66 qn67 qn68 qn69 qn70 qn71 qn72 qn73 qn74 qn75 qn76 qn77 qn78
drop qn79 qn80 qn81 qn82 qn83 qn84 qn85 qn86 qn87 qn88 qn89 qn90 qn91 qn92 q92
drop qnfrcig qnanytob qnfrvg qndlype qnminpa qnnopa qnasatck qnrovwgt qnovwgt
drop bmipct q93 q94 q95 q96 q97 qn93 qn94 qn95 qn96 qn97 q4orig ethorig raceorig
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if q4==6
replace race=2 if q4==3
replace race=3 if q4==4
replace race=3 if q4==7
replace race=4 if q4==1
replace race=4 if q4==2
replace race=4 if q4==5
replace race=4 if q4==8
tab race q4, missing
gen race_min=.
replace race_min=1 if q4==6
replace race_min=2 if q4==3
replace race_min=2 if q4==4
replace race_min=2 if q4==7
replace race_min=3 if q4==1
replace race_min=3 if q4==2
replace race_min=3 if q4==5
replace race_min=3 if q4==8
tab race_min q4, missing
gen race6=.
replace race6=1 if q4==6
replace race6=2 if q4==3
replace race6=3 if q4==4
replace race6=3 if q4==7
replace race6=4 if q4==2
replace race6=4 if q4==5
replace race6=5 if q4==1
replace race6=6 if q4==8
tab race6 q4, missing
drop q4
*seatbelt
gen seatbelt=.
replace seatbelt=1 if q9==5
replace seatbelt=2 if q9==1
replace seatbelt=2 if q9==2
replace seatbelt=2 if q9==3
replace seatbelt=2 if q9==4
tab seatbelt q9, missing
drop q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if q30==2
replace smoke_n_cat=1 if q30==3
replace smoke_n_cat=1 if q30==4
replace smoke_n_cat=1 if q30==5
replace smoke_n_cat=1 if q30==6
replace smoke_n_cat=1 if q30==7
replace smoke_n_cat=2 if q30==1
tab smoke_n_cat q30, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if q41==2
replace alc_n_cat=1 if q41==3
replace alc_n_cat=1 if q41==4
replace alc_n_cat=1 if q41==5
replace alc_n_cat=1 if q41==6
replace alc_n_cat=1 if q41==7
replace alc_n_cat=2 if q41==1
tab alc_n_cat q41, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if q44==2
replace mar_cat=1 if q44==3
replace mar_cat=1 if q44==4
replace mar_cat=1 if q44==5
replace mar_cat=1 if q44==6
replace mar_cat=1 if q44==7
replace mar_cat=2 if q44==1
tab mar_cat q44, missing
gen mar_cat_month=.
replace mar_cat_month=1 if q46==2
replace mar_cat_month=1 if q46==3
replace mar_cat_month=1 if q46==4
replace mar_cat_month=1 if q46==5
replace mar_cat_month=1 if q46==6
replace mar_cat_month=2 if q46==1
tab mar_cat_month q46, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if q48==2
replace cocaine_cat=1 if q48==3
replace cocaine_cat=1 if q48==4
replace cocaine_cat=1 if q48==5
replace cocaine_cat=1 if q48==6
replace cocaine_cat=2 if q48==1
tab cocaine_cat q48, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if q50==2
replace high_cat=1 if q50==3
replace high_cat=1 if q50==4
replace high_cat=1 if q50==5
replace high_cat=1 if q50==6
replace high_cat=2 if q50==1
tab high_cat q50, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if q52==2
replace drugs_cat=1 if q52==3
replace drugs_cat=1 if q52==4
replace drugs_cat=1 if q52==5
replace drugs_cat=1 if q52==6
replace drugs_cat=1 if q53==2
replace drugs_cat=1 if q53==3
replace drugs_cat=1 if q53==4
replace drugs_cat=1 if q53==5
replace drugs_cat=1 if q53==6
replace drugs_cat=1 if q51==2
replace drugs_cat=1 if q51==3
replace drugs_cat=1 if q51==4
replace drugs_cat=1 if q51==5
replace drugs_cat=1 if q51==6
replace drugs_cat=1 if q90==2
replace drugs_cat=1 if q90==3
replace drugs_cat=1 if q90==4
replace drugs_cat=1 if q90==5
replace drugs_cat=1 if q90==6
replace drugs_cat=2 if q52==1 & q53==1 & q51==1 & q90==1
tab drugs_cat q52, missing
tab drugs_cat q53, missing
tab drugs_cat q51, missing
tab drugs_cat q90, missing
drop q52 q53 q51 q90
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if q60==2
replace sex_n_cat=1 if q60==3
replace sex_n_cat=1 if q60==4
replace sex_n_cat=1 if q60==5
replace sex_n_cat=1 if q60==6
replace sex_n_cat=1 if q60==7
replace sex_n_cat=1 if q60==8
replace sex_n_cat=2 if q60==1
tab sex_n_cat q60, missing
*Condom use
gen condom=.
replace condom=1 if q62==2
replace condom=2 if q62==1
replace condom=2 if q62==3
tab condom q62, missing
drop q62
*year
gen year=2005
**Rename variables
rename q1 age
rename q2 sex
rename q3 grade
rename q5 hght
rename q6 wght
rename q12 weapon
rename q18 fight
rename q21 hurt_date
rename q22 forced
rename q23 depressed
rename q24 suicide_attempt
rename q25 suicide_plan
rename q26 suicide_n
rename q27 suicide_injury
rename q28 smoke_ever
rename q30 smoke_n_cont
rename q34 smoke_reg
rename q41 alc_n_cont
rename q42 alc_binge
rename q44 mar_cont
rename q46 mar_cont_month
rename q48 cocaine_cont
rename q50 high_cont
rename q57 sex_ever
rename q60 sex_n_cont
rename q64 self_weight
rename q81 tv

save "$data/yrbs2005_edit2.dta", replace


**YEAR = 2009

use "$data/yrbs2007.dta"  , clear
destring, replace
**Drop unneeded variables
drop q8 q10 q11 q13 q14 q15 q16 q17 q19 q20 q29 q31 q32 q33 q35 q36 q37 q38 q39 
drop q40 q43 q44 q46 q48 q50 q55 q56 q57 q59 q60 q62 q64 q66 q67 q68 q69 q70 
drop q71 q72 q73 q74 q75 q76 q77 q78 q79 q80 q82 q83 q84 q85 q86 q88 q87 q90 q91
drop qn8 qn9 qn10 qn11 qn12 qn13 qn14 qn15 qn16 qn17 qn18
drop qn19 qn20 qn21 qn22 qn23 qn24 qn25 qn26 qn27 qn28 qn29 qn30 qn31 qn32 qn33
drop qn34 qn35 qn36 qn37 qn38 qn39 qn40 qn41 qn42 qn43 qn44 qn45 qn46 qn47 qn48
drop qn49 qn50 qn51 qn52 qn53 qn54 qn55 qn56 qn57 qn58 qn59 qn60 qn61 qn62 qn63
drop qn64 qn65 qn66 qn67 qn68 qn69 qn70 qn71 qn72 qn73 qn74 qn75 qn76 qn77 qn78
drop qn79 qn80 qn81 qn82 qn83 qn84 qn85 qn86 qn87 qn88 qn89 qn90 qn91 qn92 q92
drop qnfrcig qnanytob qnfrvg qndlype qnrovwgt qnovwgt
drop bmipct q93 q94 q95 q96 q97 qn93 qn94 qn95 qn96 qn97 q98 qn98
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if raceeth==5
replace race=2 if raceeth==3
replace race=3 if raceeth==6
replace race=3 if raceeth==7
replace race=4 if raceeth==1
replace race=4 if raceeth==2
replace race=4 if raceeth==4
replace race=4 if raceeth==8
tab race raceeth, missing
gen race_min=.
replace race_min=1 if raceeth==5
replace race_min=2 if raceeth==3
replace race_min=2 if raceeth==6
replace race_min=2 if raceeth==7
replace race_min=3 if raceeth==1
replace race_min=3 if raceeth==2
replace race_min=3 if raceeth==4
replace race_min=3 if raceeth==8
tab race_min raceeth, missing
gen race6=.
replace race6=1 if raceeth==5
replace race6=2 if raceeth==3
replace race6=3 if raceeth==6
replace race6=3 if raceeth==7
replace race6=4 if raceeth==2
replace race6=4 if raceeth==4
replace race6=5 if raceeth==1
replace race6=6 if raceeth==8
tab race6 raceeth, missing
drop raceeth q4 q5
*seatbelt
gen seatbelt=.
replace seatbelt=1 if q9==5
replace seatbelt=2 if q9==1
replace seatbelt=2 if q9==2
replace seatbelt=2 if q9==3
replace seatbelt=2 if q9==4
tab seatbelt q9, missing
drop q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if q30==2
replace smoke_n_cat=1 if q30==3
replace smoke_n_cat=1 if q30==4
replace smoke_n_cat=1 if q30==5
replace smoke_n_cat=1 if q30==6
replace smoke_n_cat=1 if q30==7
replace smoke_n_cat=2 if q30==1
tab smoke_n_cat q30, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if q41==2
replace alc_n_cat=1 if q41==3
replace alc_n_cat=1 if q41==4
replace alc_n_cat=1 if q41==5
replace alc_n_cat=1 if q41==6
replace alc_n_cat=1 if q41==7
replace alc_n_cat=2 if q41==1
tab alc_n_cat q41, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if q45==2
replace mar_cat=1 if q45==3
replace mar_cat=1 if q45==4
replace mar_cat=1 if q45==5
replace mar_cat=1 if q45==6
replace mar_cat=1 if q45==7
replace mar_cat=2 if q45==1
tab mar_cat q45, missing
gen mar_cat_month=.
replace mar_cat_month=1 if q47==2
replace mar_cat_month=1 if q47==3
replace mar_cat_month=1 if q47==4
replace mar_cat_month=1 if q47==5
replace mar_cat_month=1 if q47==6
replace mar_cat_month=2 if q47==1
tab mar_cat_month q47, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if q49==2
replace cocaine_cat=1 if q49==3
replace cocaine_cat=1 if q49==4
replace cocaine_cat=1 if q49==5
replace cocaine_cat=1 if q49==6
replace cocaine_cat=2 if q49==1
tab cocaine_cat q49, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if q51==2
replace high_cat=1 if q51==3
replace high_cat=1 if q51==4
replace high_cat=1 if q51==5
replace high_cat=1 if q51==6
replace high_cat=2 if q51==1
tab high_cat q51, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if q52==2
replace drugs_cat=1 if q52==3
replace drugs_cat=1 if q52==4
replace drugs_cat=1 if q52==5
replace drugs_cat=1 if q52==6
replace drugs_cat=1 if q53==2
replace drugs_cat=1 if q53==3
replace drugs_cat=1 if q53==4
replace drugs_cat=1 if q53==5
replace drugs_cat=1 if q53==6
replace drugs_cat=1 if q54==2
replace drugs_cat=1 if q54==3
replace drugs_cat=1 if q54==4
replace drugs_cat=1 if q54==5
replace drugs_cat=1 if q54==6
replace drugs_cat=1 if q89==2
replace drugs_cat=1 if q89==3
replace drugs_cat=1 if q89==4
replace drugs_cat=1 if q89==5
replace drugs_cat=1 if q89==6
replace drugs_cat=2 if q52==1 & q53==1 & q54==1 & q89==1
tab drugs_cat q52, missing
tab drugs_cat q53, missing
tab drugs_cat q54, missing
tab drugs_cat q89, missing
drop q52 q53 q54 q89
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if q61==2
replace sex_n_cat=1 if q61==3
replace sex_n_cat=1 if q61==4
replace sex_n_cat=1 if q61==5
replace sex_n_cat=1 if q61==6
replace sex_n_cat=1 if q61==7
replace sex_n_cat=1 if q61==8
replace sex_n_cat=2 if q61==1
tab sex_n_cat q61, missing
*Condom use
gen condom=.
replace condom=1 if q63==2
replace condom=2 if q63==1
replace condom=2 if q63==3
tab condom q63, missing
drop q63
*year
gen year=2007
**Rename variables
rename q1 age
rename q2 sex
rename q3 grade
rename q6 hght
rename q7 wght
rename q12 weapon
rename q18 fight
rename q21 hurt_date
rename q22 forced
rename q23 depressed
rename q24 suicide_attempt
rename q25 suicide_plan
rename q26 suicide_n
rename q27 suicide_injury
rename q28 smoke_ever
rename q30 smoke_n_cont
rename q34 smoke_reg
rename q41 alc_n_cont
rename q42 alc_binge
rename q45 mar_cont
rename q47 mar_cont_month
rename q49 cocaine_cont
rename q51 high_cont
rename q58 sex_ever
rename q61 sex_n_cont
rename q65 self_weight
rename q81 tv

save "$data/yrbs2007_edit2.dta", replace


**YEAR = 2009

use "$data/yrbs2009.dta" , clear
destring, replace
**Drop unneeded variables
drop q8 q10 q11 q13 q14 q15 q16 q18 q19 q22 q29 q31 q32 q33 q35 q36 q37 q38 q39 
drop q40 q43 q44 q46 q48 q50 q55 q56 q57 q59 q60 q62 q64 q66 q67 q68 q69 q70 
drop q71 q72 q73 q74 q75 q76 q77 q78 q79 q80 q82 q83 q84 q85 q86 q88 q87 q90 q91
drop qn8 qn9 qn10 qn11 qn12 qn13 qn14 qn15 qn16 qn17 qn18
drop qn19 qn20 qn21 qn22 qn23 qn24 qn25 qn26 qn27 qn28 qn29 qn30 qn31 qn32 qn33
drop qn34 qn35 qn36 qn37 qn38 qn39 qn40 qn41 qn42 qn43 qn44 qn45 qn46 qn47 qn48
drop qn49 qn50 qn51 qn52 qn53 qn54 qn55 qn56 qn57 qn58 qn59 qn60 qn61 qn62 qn63
drop qn64 qn65 qn66 qn67 qn68 qn69 qn70 qn71 qn72 qn73 qn74 qn75 qn76 qn77 qn78
drop qn79 qn80 qn81 qn82 qn83 qn84 qn85 qn86 qn87 qn88 qn89 qn90 qn91 qn92 q92
drop qnfrcig qnanytob qnfrvg qnfruit qnveg qndlype qnobese qndepo
drop qndepopl qndual qnpa0day qnpa7day 
drop bmipct q93 q94 q95 q96 q97 qn93 qn94 qn95 qn96 qn97 q98 qn98
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if raceeth==5
replace race=2 if raceeth==3
replace race=3 if raceeth==6
replace race=3 if raceeth==7
replace race=4 if raceeth==1
replace race=4 if raceeth==2
replace race=4 if raceeth==4
replace race=4 if raceeth==8
tab race raceeth, missing
gen race_min=.
replace race_min=1 if raceeth==5
replace race_min=2 if raceeth==3
replace race_min=2 if raceeth==6
replace race_min=2 if raceeth==7
replace race_min=3 if raceeth==1
replace race_min=3 if raceeth==2
replace race_min=3 if raceeth==4
replace race_min=3 if raceeth==8
tab race_min raceeth, missing
gen race6=.
replace race6=1 if raceeth==5
replace race6=2 if raceeth==3
replace race6=3 if raceeth==6
replace race6=3 if raceeth==7
replace race6=4 if raceeth==2
replace race6=4 if raceeth==4
replace race6=5 if raceeth==1
replace race6=6 if raceeth==8
tab race6 raceeth, missing
drop raceeth q4 q5
*seatbelt
gen seatbelt=.
replace seatbelt=1 if q9==5
replace seatbelt=2 if q9==1
replace seatbelt=2 if q9==2
replace seatbelt=2 if q9==3
replace seatbelt=2 if q9==4
tab seatbelt q9, missing
drop q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if q30==2
replace smoke_n_cat=1 if q30==3
replace smoke_n_cat=1 if q30==4
replace smoke_n_cat=1 if q30==5
replace smoke_n_cat=1 if q30==6
replace smoke_n_cat=1 if q30==7
replace smoke_n_cat=2 if q30==1
tab smoke_n_cat q30, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if q41==2
replace alc_n_cat=1 if q41==3
replace alc_n_cat=1 if q41==4
replace alc_n_cat=1 if q41==5
replace alc_n_cat=1 if q41==6
replace alc_n_cat=1 if q41==7
replace alc_n_cat=2 if q41==1
tab alc_n_cat q41, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if q45==2
replace mar_cat=1 if q45==3
replace mar_cat=1 if q45==4
replace mar_cat=1 if q45==5
replace mar_cat=1 if q45==6
replace mar_cat=1 if q45==7
replace mar_cat=2 if q45==1
tab mar_cat q45, missing
gen mar_cat_month=.
replace mar_cat_month=1 if q47==2
replace mar_cat_month=1 if q47==3
replace mar_cat_month=1 if q47==4
replace mar_cat_month=1 if q47==5
replace mar_cat_month=1 if q47==6
replace mar_cat_month=2 if q47==1
tab mar_cat_month q47, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if q49==2
replace cocaine_cat=1 if q49==3
replace cocaine_cat=1 if q49==4
replace cocaine_cat=1 if q49==5
replace cocaine_cat=1 if q49==6
replace cocaine_cat=2 if q49==1
tab cocaine_cat q49, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if q51==2
replace high_cat=1 if q51==3
replace high_cat=1 if q51==4
replace high_cat=1 if q51==5
replace high_cat=1 if q51==6
replace high_cat=2 if q51==1
tab high_cat q51, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if q52==2
replace drugs_cat=1 if q52==3
replace drugs_cat=1 if q52==4
replace drugs_cat=1 if q52==5
replace drugs_cat=1 if q52==6
replace drugs_cat=1 if q53==2
replace drugs_cat=1 if q53==3
replace drugs_cat=1 if q53==4
replace drugs_cat=1 if q53==5
replace drugs_cat=1 if q53==6
replace drugs_cat=1 if q54==2
replace drugs_cat=1 if q54==3
replace drugs_cat=1 if q54==4
replace drugs_cat=1 if q54==5
replace drugs_cat=1 if q54==6
replace drugs_cat=1 if q89==2
replace drugs_cat=1 if q89==3
replace drugs_cat=1 if q89==4
replace drugs_cat=1 if q89==5
replace drugs_cat=1 if q89==6
replace drugs_cat=2 if q52==1 & q53==1 & q54==1 & q89==1
tab drugs_cat q52, missing
tab drugs_cat q53, missing
tab drugs_cat q54, missing
tab drugs_cat q89, missing
drop q52 q53 q54 q89
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if q61==2
replace sex_n_cat=1 if q61==3
replace sex_n_cat=1 if q61==4
replace sex_n_cat=1 if q61==5
replace sex_n_cat=1 if q61==6
replace sex_n_cat=1 if q61==7
replace sex_n_cat=1 if q61==8
replace sex_n_cat=2 if q61==1
tab sex_n_cat q61, missing
*Condom use
gen condom=.
replace condom=1 if q63==2
replace condom=2 if q63==1
replace condom=2 if q63==3
tab condom q63, missing
drop q63
*year
gen year=2009
**Rename variables
rename q1 age
rename q2 sex
rename q3 grade
rename q6 hght
rename q7 wght
rename q12 weapon
rename q17 fight
rename q20 hurt_date
rename q21 forced
rename q23 depressed
rename q24 suicide_attempt
rename q25 suicide_plan
rename q26 suicide_n
rename q27 suicide_injury
rename q28 smoke_ever
rename q30 smoke_n_cont
rename q34 smoke_reg
rename q41 alc_n_cont
rename q42 alc_binge
rename q45 mar_cont
rename q47 mar_cont_month
rename q49 cocaine_cont
rename q51 high_cont
rename q58 sex_ever
rename q61 sex_n_cont
rename q65 self_weight
rename q81 tv

save "$data/yrbs2009_edit2.dta", replace


**YEAR = 2011

use "$data/yrbs2011.dta" , clear
destring, replace
**Drop unneeded variables
drop q8 q10 q11 q13 q14 q15 q16 q18 q19 q22 q23 q30 q32 q33 q34 q36 q37 q38 q39 
drop q40 q41 q44 q45 q47 q49 q51 q56 q57 q58 q59 q61 q62 q64 q66 q68 q69 q70 
drop q71 q72 q73 q74 q75 q76 q77 q78 q79 q81 q82 q83 q84 q85 q86 q88 q87 q90 q91
drop qn8 qn9 qn10 qn11 qn12 qn13 qn14 qn15 qn16 qn17 qn18
drop qn19 qn20 qn21 qn22 qn23 qn24 qn25 qn26 qn27 qn28 qn29 qn30 qn31 qn32 qn33
drop qn34 qn35 qn36 qn37 qn38 qn39 qn40 qn41 qn42 qn43 qn44 qn45 qn46 qn47 qn48
drop qn49 qn50 qn51 qn52 qn53 qn54 qn55 qn56 qn57 qn58 qn59 qn60 qn61 qn62 qn63
drop qn64 qn65 qn66 qn67 qn68 qn69 qn70 qn71 qn72 qn73 qn74 qn75 qn76 qn77 qn78
drop qn79 qn80 qn81 qn82 qn83 qn84 qn85 qn86 qn87 qn88 qn89 qn90 qn91 qn92 q92
drop qnfrcig qnanytob qnfrvg qnfrvg2 qnfruit qnveg qndlype qnowt qnobese qndepo
drop qndepopl qndual qnpa0day qnpa7day 
drop bmipct q93 q94 q95 q96 q97 qn93 qn94 qn95 qn96 qn97
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if raceeth==5
replace race=2 if raceeth==3
replace race=3 if raceeth==6
replace race=3 if raceeth==7
replace race=4 if raceeth==1
replace race=4 if raceeth==2
replace race=4 if raceeth==4
replace race=4 if raceeth==8
tab race raceeth, missing
gen race_min=.
replace race_min=1 if raceeth==5
replace race_min=2 if raceeth==3
replace race_min=2 if raceeth==6
replace race_min=2 if raceeth==7
replace race_min=3 if raceeth==1
replace race_min=3 if raceeth==2
replace race_min=3 if raceeth==4
replace race_min=3 if raceeth==8
tab race_min raceeth, missing
gen race6=.
replace race6=1 if raceeth==5
replace race6=2 if raceeth==3
replace race6=3 if raceeth==6
replace race6=3 if raceeth==7
replace race6=4 if raceeth==2
replace race6=4 if raceeth==4
replace race6=5 if raceeth==1
replace race6=6 if raceeth==8
tab race6 raceeth, missing
drop raceeth q4 q5
*seatbelt
gen seatbelt=.
replace seatbelt=1 if q9==5
replace seatbelt=2 if q9==1
replace seatbelt=2 if q9==2
replace seatbelt=2 if q9==3
replace seatbelt=2 if q9==4
tab seatbelt q9, missing
drop q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if q31==2
replace smoke_n_cat=1 if q31==3
replace smoke_n_cat=1 if q31==4
replace smoke_n_cat=1 if q31==5
replace smoke_n_cat=1 if q31==6
replace smoke_n_cat=1 if q31==7
replace smoke_n_cat=2 if q31==1
tab smoke_n_cat q31, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if q42==2
replace alc_n_cat=1 if q42==3
replace alc_n_cat=1 if q42==4
replace alc_n_cat=1 if q42==5
replace alc_n_cat=1 if q42==6
replace alc_n_cat=1 if q42==7
replace alc_n_cat=2 if q42==1
tab alc_n_cat q42, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if q46==2
replace mar_cat=1 if q46==3
replace mar_cat=1 if q46==4
replace mar_cat=1 if q46==5
replace mar_cat=1 if q46==6
replace mar_cat=1 if q46==7
replace mar_cat=2 if q46==1
tab mar_cat q46, missing
gen mar_cat_month=.
replace mar_cat_month=1 if q48==2
replace mar_cat_month=1 if q48==3
replace mar_cat_month=1 if q48==4
replace mar_cat_month=1 if q48==5
replace mar_cat_month=1 if q48==6
replace mar_cat_month=2 if q48==1
tab mar_cat_month q48, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if q50==2
replace cocaine_cat=1 if q50==3
replace cocaine_cat=1 if q50==4
replace cocaine_cat=1 if q50==5
replace cocaine_cat=1 if q50==6
replace cocaine_cat=2 if q50==1
tab cocaine_cat q50, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if q52==2
replace high_cat=1 if q52==3
replace high_cat=1 if q52==4
replace high_cat=1 if q52==5
replace high_cat=1 if q52==6
replace high_cat=2 if q52==1
tab high_cat q52, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if q55==2
replace drugs_cat=1 if q55==3
replace drugs_cat=1 if q55==4
replace drugs_cat=1 if q55==5
replace drugs_cat=1 if q55==6
replace drugs_cat=1 if q53==2
replace drugs_cat=1 if q53==3
replace drugs_cat=1 if q53==4
replace drugs_cat=1 if q53==5
replace drugs_cat=1 if q53==6
replace drugs_cat=1 if q54==2
replace drugs_cat=1 if q54==3
replace drugs_cat=1 if q54==4
replace drugs_cat=1 if q54==5
replace drugs_cat=1 if q54==6
replace drugs_cat=1 if q89==2
replace drugs_cat=1 if q89==3
replace drugs_cat=1 if q89==4
replace drugs_cat=1 if q89==5
replace drugs_cat=1 if q89==6
replace drugs_cat=2 if q55==1 & q53==1 & q54==1 & q89==1
tab drugs_cat q55, missing
tab drugs_cat q53, missing
tab drugs_cat q54, missing
tab drugs_cat q89, missing
drop q55 q53 q54 q89
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if q63==2
replace sex_n_cat=1 if q63==3
replace sex_n_cat=1 if q63==4
replace sex_n_cat=1 if q63==5
replace sex_n_cat=1 if q63==6
replace sex_n_cat=1 if q63==7
replace sex_n_cat=1 if q63==8
replace sex_n_cat=2 if q63==1
tab sex_n_cat q63, missing
*Condom use
gen condom=.
replace condom=1 if q65==2
replace condom=2 if q65==1
replace condom=2 if q65==3
tab condom q65, missing
drop q65
*year
gen year=2011
**Rename variables
rename q1 age
rename q2 sex
rename q3 grade
rename q6 hght
rename q7 wght
rename q12 weapon
rename q17 fight
rename q20 hurt_date
rename q21 forced
rename q24 depressed
rename q25 suicide_attempt
rename q26 suicide_plan
rename q27 suicide_n
rename q28 suicide_injury
rename q29 smoke_ever
rename q31 smoke_n_cont
rename q35 smoke_reg
rename q42 alc_n_cont
rename q43 alc_binge
rename q46 mar_cont
rename q48 mar_cont_month
rename q50 cocaine_cont
rename q52 high_cont
rename q60 sex_ever
rename q63 sex_n_cont
rename q67 self_weight
rename q80 tv

save "$data/yrbs2011_edit2.dta", replace


**YEAR = 2013

use "$data/yrbs2013.dta", clear
destring, replace
**Drop unneeded variables
drop Q8 Q10 Q11 Q12 Q14 Q15 Q16 Q17 Q19 Q20 Q22 Q25 Q32 Q34 Q35 Q36 Q38 Q39 Q40 
drop Q41 Q42 Q45 Q46 Q48 Q55 Q56 Q57 Q58 Q60 Q61 Q63 Q65 Q67 Q68 Q69 Q70 Q71 
drop Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q83 Q84 Q85 Q86 Q88 Q89 Q89 Q90 Q91
drop Q6ORIG Q7ORIG QN8 QN9 QN10 QN11 QN12 QN13 QN14 QN15 QN16 QN17 QN18 Q23 Q24
drop QN19 QN20 QN21 QN22 QN23 QN24 QN25 QN26 QN27 QN28 QN29 QN30 QN31 QN32 QN33
drop QN34 QN35 QN36 QN37 QN38 QN39 QN40 QN41 QN42 QN43 QN44 QN45 QN46 QN47 QN48
drop QN49 QN50 QN51 QN52 QN53 QN54 QN55 QN56 QN57 QN58 QN59 QN60 QN61 QN62 QN63
drop QN64 QN65 QN66 QN67 QN68 QN69 QN70 QN71 QN72 QN73 QN74 QN75 QN76 QN77 QN78
drop QN79 QN80 QN81 QN82 QN83 QN84 QN85 QN86 QN87 QN88 QN89 QN90 QN91 QN92 Q92
drop Q82 qnfrcig qnanytob qnothh qnothhpl qndualbc qnbcnone qnfrvg qnfruit QNFR0
drop QNFR1 QNFR1 QNFR3 qnveg QNVEG0 QNVEG1 QNVEG2 QNFRVG2 QNSODA0 QNSODA2 
drop QNSODA3 QNMILK0 QNMILK1 QNMILK2 qnnobkft qndlype QNPA0DAY QNPA7DAY qnowt
drop qnobese bmipct 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if raceeth==5
replace race=2 if raceeth==3
replace race=3 if raceeth==6
replace race=3 if raceeth==7
replace race=4 if raceeth==1
replace race=4 if raceeth==2
replace race=4 if raceeth==4
replace race=4 if raceeth==8
tab race raceeth, missing
gen race_min=.
replace race_min=1 if raceeth==5
replace race_min=2 if raceeth==3
replace race_min=2 if raceeth==6
replace race_min=2 if raceeth==7
replace race_min=3 if raceeth==1
replace race_min=3 if raceeth==2
replace race_min=3 if raceeth==4
replace race_min=3 if raceeth==8
tab race_min raceeth, missing
gen race6=.
replace race6=1 if raceeth==5
replace race6=2 if raceeth==3
replace race6=3 if raceeth==6
replace race6=3 if raceeth==7
replace race6=4 if raceeth==2
replace race6=4 if raceeth==4
replace race6=5 if raceeth==1
replace race6=6 if raceeth==8
tab race6 raceeth, missing
drop raceeth Q4 Q5
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q9==5
replace seatbelt=2 if Q9==1
replace seatbelt=2 if Q9==2
replace seatbelt=2 if Q9==3
replace seatbelt=2 if Q9==4
tab seatbelt Q9, missing
drop Q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q33==2
replace smoke_n_cat=1 if Q33==3
replace smoke_n_cat=1 if Q33==4
replace smoke_n_cat=1 if Q33==5
replace smoke_n_cat=1 if Q33==6
replace smoke_n_cat=1 if Q33==7
replace smoke_n_cat=2 if Q33==1
tab smoke_n_cat Q33, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q43==2
replace alc_n_cat=1 if Q43==3
replace alc_n_cat=1 if Q43==4
replace alc_n_cat=1 if Q43==5
replace alc_n_cat=1 if Q43==6
replace alc_n_cat=1 if Q43==7
replace alc_n_cat=2 if Q43==1
tab alc_n_cat Q43, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q47==2
replace mar_cat=1 if Q47==3
replace mar_cat=1 if Q47==4
replace mar_cat=1 if Q47==5
replace mar_cat=1 if Q47==6
replace mar_cat=1 if Q47==7
replace mar_cat=2 if Q47==1
tab mar_cat Q47, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q49==2
replace mar_cat_month=1 if Q49==3
replace mar_cat_month=1 if Q49==4
replace mar_cat_month=1 if Q49==5
replace mar_cat_month=1 if Q49==6
replace mar_cat_month=2 if Q49==1
tab mar_cat_month Q49, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q50==2
replace cocaine_cat=1 if Q50==3
replace cocaine_cat=1 if Q50==4
replace cocaine_cat=1 if Q50==5
replace cocaine_cat=1 if Q50==6
replace cocaine_cat=2 if Q50==1
tab cocaine_cat Q50, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q51==2
replace high_cat=1 if Q51==3
replace high_cat=1 if Q51==4
replace high_cat=1 if Q51==5
replace high_cat=1 if Q51==6
replace high_cat=2 if Q51==1
tab high_cat Q51, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q52==2
replace drugs_cat=1 if Q52==3
replace drugs_cat=1 if Q52==4
replace drugs_cat=1 if Q52==5
replace drugs_cat=1 if Q52==6
replace drugs_cat=1 if Q53==2
replace drugs_cat=1 if Q53==3
replace drugs_cat=1 if Q53==4
replace drugs_cat=1 if Q53==5
replace drugs_cat=1 if Q53==6
replace drugs_cat=1 if Q54==2
replace drugs_cat=1 if Q54==3
replace drugs_cat=1 if Q54==4
replace drugs_cat=1 if Q54==5
replace drugs_cat=1 if Q54==6
replace drugs_cat=1 if Q87==2
replace drugs_cat=1 if Q87==3
replace drugs_cat=1 if Q87==4
replace drugs_cat=1 if Q87==5
replace drugs_cat=1 if Q87==6
replace drugs_cat=2 if Q52==1 & Q53==1 & Q54==1 & Q87==1
tab drugs_cat Q52, missing
tab drugs_cat Q53, missing
tab drugs_cat Q54, missing
tab drugs_cat Q87, missing
drop Q52 Q53 Q54 Q87
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q62==2
replace sex_n_cat=1 if Q62==3
replace sex_n_cat=1 if Q62==4
replace sex_n_cat=1 if Q62==5
replace sex_n_cat=1 if Q62==6
replace sex_n_cat=1 if Q62==7
replace sex_n_cat=1 if Q62==8
replace sex_n_cat=2 if Q62==1
tab sex_n_cat Q62, missing
*Condom use
gen condom=.
replace condom=1 if Q64==2
replace condom=2 if Q64==1
replace condom=2 if Q64==3
tab condom
*year
gen year=2013
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q6 hght
rename Q7 wght
rename Q13 weapon
rename Q18 fight
rename Q21 forced
rename Q26 depressed
rename Q27 suicide_attempt
rename Q28 suicide_plan
rename Q29 suicide_n
rename Q30 suicide_injury
rename Q31 smoke_ever
rename Q33 smoke_n_cont
rename Q37 smoke_reg
rename Q43 alc_n_cont
rename Q44 alc_binge
rename Q47 mar_cont
rename Q49 mar_cont_month
rename Q50 cocaine_cont
rename Q51 high_cont
rename Q59 sex_ever
rename Q62 sex_n_cont
rename Q66 self_weight
rename Q81 tv

save "$data/yrbs2013_edit2.dta", replace


**YEAR = 2015
use "$data/yrbs2015.dta", clear
destring, replace
**Drop unneeded variables
drop Q8 Q10 Q11 Q12 Q14 Q15 Q16 Q17 Q19 Q20 Q22 Q25 Q32 Q34 Q35 Q36 Q38 Q39 Q40 
drop Q41 Q42 Q45 Q46 Q48 Q55 Q56 Q57 Q58 Q59 Q61 Q66 Q70 Q71 Q94 Q95 Q37 Q62 Q64
drop Q72 Q73 Q74 Q75 Q76 Q77 Q78 Q79 Q80 Q83 Q84 Q85 Q86 Q88 Q89 Q89 Q90 Q87 Q93 
drop Q6ORIG Q7ORIG QN8 QN9 QN10 QN11 QN12 QN13 QN14 QN15 QN16 QN17 QN18 Q23 Q24
drop Q96 Q97 Q98 Q99 QN93 QN94 QN95 QN96 QN97 QN98 QN99 QNTOB4 qndaycig qncigint
drop QNTOB2 QNTOB3 QNNOTOB4 QNNOTOB3 QNNOTOB2 qniudimp qnshparg QNFR2 QNVEG3 QNSODA1
drop QNMILK3 QNBK7DAY QNSPDRK1 QNSPDRK2 QNSPDRK3 QNWATER1 QNWATER2 QNWATER3 
drop QN19 QN20 QN21 QN22 QN23 QN24 QN25 QN26 QN27 QN28 QN29 QN30 QN31 QN32 QN33
drop QN34 QN35 QN36 QN37 QN38 QN39 QN40 QN41 QN42 QN43 QN44 QN45 QN46 QN47 QN48
drop QN49 QN50 QN51 QN52 QN53 QN54 QN55 QN56 QN57 QN58 QN59 QN60 QN61 QN62 QN63
drop QN64 QN65 QN66 QN69 QN70 QN71 QN72 QN73 QN74 QN75 QN76 QN77 QN78
drop QN79 QN80 QN81 QN82 QN83 QN84 QN85 QN86 QN87 QN88 QN89 QN90 QN91 QN92 Q92
drop Q82 qnfrcig qnothh qnothhpl qndualbc qnbcnone QNFR0
drop QNFR1 QNFR1 QNFR3 QNVEG0 QNVEG1 QNVEG2 QNSODA2 
drop QNSODA3  QNMILK1 QNMILK2 qndlype QNPA0DAY QNPA7DAY qnowt
drop qnobese bmipct 
**Create new variables
*race/ethnicity
gen race=.
replace race=1 if raceeth==5
replace race=2 if raceeth==3
replace race=3 if raceeth==6
replace race=3 if raceeth==7
replace race=4 if raceeth==1
replace race=4 if raceeth==2
replace race=4 if raceeth==4
replace race=4 if raceeth==8
tab race raceeth, missing
gen race_min=.
replace race_min=1 if raceeth==5
replace race_min=2 if raceeth==3
replace race_min=2 if raceeth==6
replace race_min=2 if raceeth==7
replace race_min=3 if raceeth==1
replace race_min=3 if raceeth==2
replace race_min=3 if raceeth==4
replace race_min=3 if raceeth==8
tab race_min raceeth, missing
gen race6=.
replace race6=1 if raceeth==5
replace race6=2 if raceeth==3
replace race6=3 if raceeth==6
replace race6=3 if raceeth==7
replace race6=4 if raceeth==2
replace race6=4 if raceeth==4
replace race6=5 if raceeth==1
replace race6=6 if raceeth==8
tab race6 raceeth, missing
drop raceeth Q4 Q5
*seatbelt
gen seatbelt=.
replace seatbelt=1 if Q9==5
replace seatbelt=2 if Q9==1
replace seatbelt=2 if Q9==2
replace seatbelt=2 if Q9==3
replace seatbelt=2 if Q9==4
tab seatbelt Q9, missing
drop Q9
*smoking amount
gen smoke_n_cat=.
replace smoke_n_cat=1 if Q33==2
replace smoke_n_cat=1 if Q33==3
replace smoke_n_cat=1 if Q33==4
replace smoke_n_cat=1 if Q33==5
replace smoke_n_cat=1 if Q33==6
replace smoke_n_cat=1 if Q33==7
replace smoke_n_cat=2 if Q33==1
tab smoke_n_cat Q33, missing
*alcohol amount
gen alc_n_cat=.
replace alc_n_cat=1 if Q43==2
replace alc_n_cat=1 if Q43==3
replace alc_n_cat=1 if Q43==4
replace alc_n_cat=1 if Q43==5
replace alc_n_cat=1 if Q43==6
replace alc_n_cat=1 if Q43==7
replace alc_n_cat=2 if Q43==1
tab alc_n_cat Q43, missing
*marijuana
gen mar_cat=.
replace mar_cat=1 if Q47==2
replace mar_cat=1 if Q47==3
replace mar_cat=1 if Q47==4
replace mar_cat=1 if Q47==5
replace mar_cat=1 if Q47==6
replace mar_cat=1 if Q47==7
replace mar_cat=2 if Q47==1
tab mar_cat Q47, missing
gen mar_cat_month=.
replace mar_cat_month=1 if Q49==2
replace mar_cat_month=1 if Q49==3
replace mar_cat_month=1 if Q49==4
replace mar_cat_month=1 if Q49==5
replace mar_cat_month=1 if Q49==6
replace mar_cat_month=2 if Q49==1
tab mar_cat_month Q49, missing
*cocaine
gen cocaine_cat=.
replace cocaine_cat=1 if Q50==2
replace cocaine_cat=1 if Q50==3
replace cocaine_cat=1 if Q50==4
replace cocaine_cat=1 if Q50==5
replace cocaine_cat=1 if Q50==6
replace cocaine_cat=2 if Q50==1
tab cocaine_cat Q50, missing
*inhale/sniffed to get high
gen high_cat=.
replace high_cat=1 if Q51==2
replace high_cat=1 if Q51==3
replace high_cat=1 if Q51==4
replace high_cat=1 if Q51==5
replace high_cat=1 if Q51==6
replace high_cat=2 if Q51==1
tab high_cat Q51, missing
*other drugs category
gen drugs_cat=.
replace drugs_cat=1 if Q52==2
replace drugs_cat=1 if Q52==3
replace drugs_cat=1 if Q52==4
replace drugs_cat=1 if Q52==5
replace drugs_cat=1 if Q52==6
replace drugs_cat=1 if Q53==2
replace drugs_cat=1 if Q53==3
replace drugs_cat=1 if Q53==4
replace drugs_cat=1 if Q53==5
replace drugs_cat=1 if Q53==6
replace drugs_cat=1 if Q54==2
replace drugs_cat=1 if Q54==3
replace drugs_cat=1 if Q54==4
replace drugs_cat=1 if Q54==5
replace drugs_cat=1 if Q54==6
replace drugs_cat=1 if Q91==2
replace drugs_cat=1 if Q91==3
replace drugs_cat=1 if Q91==4
replace drugs_cat=1 if Q91==5
replace drugs_cat=1 if Q91==6
replace drugs_cat=2 if Q52==1 & Q53==1 & Q54==1 & Q91==1
tab drugs_cat Q52, missing
tab drugs_cat Q53, missing
tab drugs_cat Q54, missing
tab drugs_cat Q91, missing
drop Q52 Q53 Q54 Q91
*Number of sexual partners
gen sex_n_cat=.
replace sex_n_cat=1 if Q63==2
replace sex_n_cat=1 if Q63==3
replace sex_n_cat=1 if Q63==4
replace sex_n_cat=1 if Q63==5
replace sex_n_cat=1 if Q63==6
replace sex_n_cat=1 if Q63==7
replace sex_n_cat=1 if Q63==8
replace sex_n_cat=2 if Q63==1
tab sex_n_cat Q63, missing
*Condom use
gen condom=.
replace condom=1 if Q65==2
replace condom=2 if Q65==1
replace condom=2 if Q65==3
tab condom
*year
gen year=2015
**Rename variables
rename Q1 age
rename Q2 sex
rename Q3 grade
rename Q6 hght
rename Q7 wght
rename Q13 weapon
rename Q18 fight
rename Q21 forced
rename Q26 depressed
rename Q27 suicide_attempt
rename Q28 suicide_plan
rename Q29 suicide_n
rename Q30 suicide_injury
rename Q31 smoke_ever
rename Q33 smoke_n_cont
rename Q43 alc_n_cont
rename Q44 alc_binge
rename Q47 mar_cont
rename Q49 mar_cont_month
rename Q50 cocaine_cont
rename Q51 high_cont
rename Q60 sex_ever
rename Q63 sex_n_cont
rename Q69 self_weight
rename Q81 tv

save "$data/yrbs2015_edit2.dta", replace

***************************************************
****PART B - CREATE MERGED DATA FILE WITH ALL YEARS
***************************************************


*Merge datafiles 
use "$data/yrbs2013_edit2.dta", clear
append using "$data/yrbs2011_edit2.dta"
append using "$data/yrbs2009_edit2.dta"
append using "$data/yrbs2007_edit2.dta"
append using "$data/yrbs2005_edit2.dta"
append using "$data/yrbs2003_edit2.dta"
append using "$data/yrbs2001_edit2.dta"
append using "$data/yrbs1999_edit2.dta"
append using "$data/yrbs1997_edit2.dta"
append using "$data/yrbs1995_edit2.dta"
append using "$data/yrbs1993_edit2.dta"
append using "$data/yrbs1991_edit2.dta"
append using "$data/yrbs2015_edit2.dta"
drop qnowt site

save "$data/yrbs_merged_race.dta", replace

***************************************************
****PART C - RECODES AND CLEANING
***************************************************

*Rename/recode/label variables in merged dataset

use "$data/yrbs_merged_race.dta", clear

*age
replace age=12 if age==1
replace age=13 if age==2
replace age=14 if age==3
replace age=15 if age==4
replace age=16 if age==5
replace age=17 if age==6
replace age=18 if age==7
tab age, missing
*gender
label define gender 1 "female" 2 "male"
label values sex gender
tab sex, missing
*grade
replace grade=9 if grade==1
replace grade=10 if grade==2
replace grade=11 if grade==3
replace grade=12 if grade==4 
replace grade=99 if grade==5
label define gradel 9 "9th" 10 "10th" 11 "11th" 12 "12th" 99 "Ungraded or other grade
label values grade gradel
tab grade, missing
*Race
label define racel 1 "non-hispanic white" 2 "black" 3 "Hispanic" 4 "other"
label values race racel
tab race, missing
label define race_minl 1 "white" 2 "black or hispanic" 3 "other"
label values race_min race_minl
tab race_min, missing
label define race6l 1"white" 2"black" 3"Hispanic" 4"asian" 5"native american" 6"other"
label values race6 race6l

*BMI
gen h2=hght*hght
gen bmi=wght/h2
drop h2
sum bmi
gen bmi_edit=bmi
replace bmi_edit=. if sex==2 & age==12 & bmi<11.5
replace bmi_edit=. if sex==2 & age==12 & bmi>41
replace bmi_edit=. if sex==1 & age==12 & bmi<11
replace bmi_edit=. if sex==1 & age==12 & bmi>40
replace bmi_edit=. if sex==2 & age==13 & bmi<13
replace bmi_edit=. if sex==2 & age==13 & bmi>55
replace bmi_edit=. if sex==2 & age==14 & bmi<13
replace bmi_edit=. if sex==2 & age==14 & bmi>55
replace bmi_edit=. if sex==1 & age==13 & bmi<13
replace bmi_edit=. if sex==1 & age==13 & bmi>55
replace bmi_edit=. if sex==1 & age==14 & bmi<13
replace bmi_edit=. if sex==1 & age==14 & bmi>55
replace bmi_edit=. if sex==2 & age>=15 & bmi<13
replace bmi_edit=. if sex==2 & age>=13 & bmi>55
replace bmi_edit=. if sex==1 & age>=15 & bmi<13
replace bmi_edit=. if sex==1 & age>=13 & bmi>55
sum bmi_edit
*Weapon
gen weapon_yn=weapon
replace weapon_yn=0 if weapon_yn==1
replace weapon_yn=1 if weapon_yn==2
replace weapon_yn=1 if weapon_yn==3
replace weapon_yn=1 if weapon_yn==4
replace weapon_yn=1 if weapon_yn==5
label define yesno 1 "yes" 0 "no"
label values weapon_yn yesno
tab weapon weapon_yn
*fight
label define times 1 "0 times" 2 "1 time" 3 "2 or 3 times" 4 "4 or 5 times" 5 "6 or 7 times" 6 "8 or 9 times" 7 "10 or 11 times" 8 "12 or more times"
label values fight times
tab fight, missing
*suicide #
label define time2 1 "0 times" 2 "1 time" 3"2 or 3 times" 4"4 or 5 times" 5 "6 or more times"
label value suicide_n time2
tab suicide_n, missing
*suicide injury
label define suin 1"I did not attempt suicide" 2"yes" 3"no"
label values suicide_injury suin
tab suicide_injury, missing
*smoking
label define days 1"0 days" 2"1 or 2 days" 3"3 to 5 days" 4"6 to 9 days" 5"10 to 19 days" 6"20 to 29 days" 7"all 30 days"
label values smoke_n_cont days
tab smoke_n_cont, missing
*alc
label values alc_n_cont days
tab alc_n_cont, missing
label define days2 1"0 days" 2"1 day" 3"2 days" 4"3 to 5 days" 5"6 to 9 days" 6"10 to 19 days" 7"20 or more days"
label values alc_binge days2
tab alc_binge, missing
*mar
label define time3 1"0 times" 2"1 or 2 times" 3"3 to 9 times" 4"10 to 19 times" 5"20 to 39 times" 6"40 to 99 times" 7"100 or more times"
label values mar_cont time3
tab mar_cont, missing
*cocaine
label define time4 1"0 times" 2"1 or 2 times" 3"3 to 9 times" 4"10 to 19 times" 5"20 to 39 times" 6"40 or more times"
label values cocaine_cont time4
tab cocaine_cont, missing
label values mar_cont_month time4
tab mar_cont_month, missing
*high
label values high_cont time4
tab high_cont, missing
*sex
label define ppl 1"I have never had sex" 2"I have had sex but not past 3 mths" 3"1 person" 4"2 people" 5"3 people" 6"4 people" 7"5 people" 8"6 or more people"
label values sex_n_cont ppl
tab sex_n_cont, missing
*weight
label define wt 1"very underweight" 2"slightly underweight" 3"about the right weight" 4"slightly overweight" 5"very overweight"
label values self_weight wt
tab self_weight, missing
*tv
label define tvl 1"no tv" 2"<1 hour" 3"1 hour" 4"2 hours" 5"3 hours" 6"4 hours" 7"5 or more hours"
label values tv tvl
tab tv, missing
*Change yes/no to 0 1
replace hurt_date=0 if hurt_date==2
label values hurt_date yesno
tab hurt_date, missing
replace forced=0 if forced==2
label values forced yesno
tab forced, missing
replace depressed=0 if depressed==2
label values depressed yesno
tab depressed, missing
replace suicide_attempt=0 if suicide_attempt==2
label values suicide_attempt yesno
tab suicide_attempt, missing
replace suicide_plan=0 if suicide_plan==2
label values suicide_plan yesno
tab suicide_plan, missing
replace smoke_ever=0 if smoke_ever==2
label values smoke_ever yesno
tab smoke_ever, missing
replace smoke_reg=0 if smoke_reg==2
label values smoke_reg yesno
tab smoke_reg, missing 
replace smoke_n_cat=0 if smoke_n_cat==2
label values smoke_n_cat yesno
tab smoke_n_cat, missing
replace alc_n_cat=0 if alc_n_cat==2
label values alc_n_cat yesno
tab alc_n_cat, missing
replace mar_cat=0 if mar_cat==2
label values mar_cat yesno
tab mar_cat, missing
replace cocaine_cat=0 if cocaine_cat==2
label values cocaine_cat yesno
tab cocaine_cat, missing
replace mar_cat_month=0 if mar_cat_month==2
label values mar_cat_month yesno
tab mar_cat_month, missing
replace high_cat=0 if high_cat==2
label values high_cat yesno
tab high_cat, missing
replace drugs_cat=0 if drugs_cat==2
label values drugs_cat yesno
tab drugs_cat, missing
replace sex_ever=0 if sex_ever==2
label values sex_ever yesno
tab sex_ever, missing
replace sex_n_cat=0 if sex_n_cat==2
label values sex_n_cat yesno
tab sex_n_cat, missing
replace condom=0 if condom==2
label values condom yesno
tab condom, missing
gen binge = alc_binge
recode binge (1=0) (2/max = 1)
recode binge (min/max = .) if alc_n_cat==.

*Add state variable names
*Label and check stfips variable
label define state 01 "AL" 02 "AK" 04 "AZ" 05 "AR" 06 "CA" 08 "CO" 09 "CT" 10"DE" 11 "DC" 12 "FL" 13 "GA" 15 "HI" 16 "ID" 17 "IL" 18 "IN" 19 "IA" 20 "KS" 21 "KY" 22 "LA" 23 "ME" 24 "MD" 25 "MA" 26 "MI" 27 "MN" 28 "MS" 29"MO" 30 "MT" 31 "NE" 32"NV" 33"NH" 34 "NJ" 35 "NM" 36 "NY" 37 "NC" 38 "ND" 39"OH" 40"OK" 41 "OR" 42 "PA"  72 "PR" 44"RI" 45 "SC" 46 "SD" 47 "TN" 48 "TX" 49"UT" 50"VT" 51"VA" 78 "VI"  53 "WA" 54 "WV" 55"WI" 56 "WY"
label values stfips state
tab stfips year, missing

*Label and recode race variable to include native Americans as an underrepresented minority
recode race_min (3=2) if race6==5
label define raceth 1 "NHW" 2 "URM"
label values race_min raceth

*Recode grade variable
replace grade=1 if grade==9
replace grade=2 if grade==10
replace grade=3 if grade==11
replace grade=4 if grade==12
tab grade

label define gradel 1 "9" 2 "10" 3 "11" 4 "12"
label values grade gradel

*Edits for additional variables  not used in analysis
gen sex_recent=.
replace sex_recent=0 if sex_n_cont==1|sex_n_cont==2
replace sex_recent=1 if sex_n_cont>2
replace sex_recent=. if sex_n_cont==.
tab sex_recent sex_n_cont

gen mult_part = sex_n_cont
recode mult_part (4/max = 1) (0/3 = 0)

gen condom2 = condom
replace condom=. if sex_recent~=1
tab sex_recent condom, missing
tab sex_n_cont condom, missing

replace condom2=. if sex_ever==0

recode self_weight (4/5 = 1) (0/3 = 0)
gen underweight = bmi
gen overweight = bmi
recode underweight (min/18.49999 =1) (18.5/max = 0)
recode overweight (min/24.99999 = 0) (25/max = 1)
gen obese = bmi
recode obese (min/29.99999 = 0) (30/max = 1)
egen unhealth_weight = rmax(underweight overweight)
egen all_drugs = rmax(smoke_n_cat alc_n_cat cocaine_cat drugs_cat mar_cat)
recode grade (99 = .)
gen binge = alc_binge
recode binge (1=0) (2/max = 1)
recode bing (min/max = .) if alc_n_cat==.

replace grade=1 if grade==9
replace grade=2 if grade==10
replace grade=3 if grade==11
replace grade=4 if grade==12
tab grade

gen sex_race = sex*1000 + race6

*Merge in state-year measures (controls)

gen stfip = stfips

joinby stfips year using "$data/state_policies.dta", unmatched(master) _merge(_POL)
rename cigtax cigtax2
gen cigtax=cigtax2/100
drop cigtax2

joinby stfip year using "$data/gdp_pop.dta", unmatched(master) _merge(_ECON)
gen ln_beertax = ln(beertaxrate)
gen ln_cigtax = ln(cigtax)
gen ln_real_pci = ln(real_pci)
gen ln_pop = ln(pop)joinby stfips using "$data/fiptocensusregion.dta", unmatched(master) _merge(_REGION)


/***********************************************************************
****PART D - SAVE FILE WITH ALL OF ABOVE MEASURES
Note - the main datafile we use ("yrbs_datafile.dta")
*does not include many of the YRBS measures coded here as (a) these
*were not considered as outcomes and (b) we want to minimize file size.
*nevertheless, users can run this code and generate the dataset "yrbs_merged_race_edit.dta"
*if they wish
***********************************************************************/
*save "$data/yrbs_merged_race_edit.dta", replace

keep age sex grade smoke_n_cat alc_n_cat race_min race6 stfips weight binge sex_race beertaxrate unemploymentrate cpi totalpopulation cigtax unemp pci pop real_pci ln_beertax ln_cigtax ln_real_pci ln_pop statefip census year

save "$data/yrbs_datafile.dta", replace




